pt
Lista de Produtos de IA
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
Página Inicial
Notícias de IA
AI Daily
Guia de Monetização
Tutoriais de IA
Navegação de Ferramentas de IA
Biblioteca de Produtos de IA
pt
Lista de Produtos de IA
Pesquise as tendências globais de produtos de IA
Pesquise informações globais de IA e descubra novas oportunidades de IA
Informação de Notícias
Aplicações de Produtos
Casos de Monetização
Tutoriais de IA
Tipo :
Informação de Notícias
Aplicações de Produtos
Casos de Monetização
Tutoriais de IA
2024-08-16 09:26:00
.
AIbase
.
11.1k
Nvidia lança nova tecnologia de código aberto: treinamento de modelos com economia de 1,8x em poder computacional!
A Nvidia lançou dois novos modelos grandes de linguagem de código aberto, Nemotron-4-Minitron-4B e Nemotron-4-Minitron-8B, que utilizam poda estruturada e destilação do conhecimento para treinar modelos de forma eficiente, reduzindo significativamente as necessidades de treinamento, dados e poder computacional. Em comparação com os métodos tradicionais, os novos modelos reduzem os dados de tokens de treinamento em 40 vezes e o custo computacional em 1,8 vezes. Através da otimização do Llama-3.18B, a poda estruturada simplifica a estrutura do modelo, enquanto a destilação do conhecimento melhora o desempenho, Minitron
2024-08-09 16:26:57
.
AIbase
.
11.0k
Velocidade de modelos grandes em telefones 5 vezes mais rápida! Nova tecnologia de código aberto da Microsoft Research Asia permite experiência ultrarrápida até em CPUs
A tecnologia T-MAC (Table-Lookup-based MAC) visa resolver os problemas de memória e restrições de computação na implantação de modelos de linguagem grandes (LLMs) em dispositivos de borda. Ao quantificar os pesos do modelo para representações de baixo bit, o T-MAC utiliza tabelas de pesquisa (LUTs) para substituir operações de multiplicação tradicionais, melhorando significativamente a eficiência de execução em CPUs. Este método reduz drasticamente a memória necessária para a computação, permitindo que LLMs com bilhões de parâmetros sejam executados de forma eficiente em dispositivos com recursos limitados, possibilitando upgrades inteligentes. Em comparação com as implementações existentes, o T-